|
Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleのMapReduceおよびGoogle File System(GFS)論文に触発されたものである。 HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。〔Hadoop Users List 〕 == アーキテクチャ == Hadoopは、以下の4つのモジュールによって構成されている。 * Hadoop Common: 他のモジュールから共通して利用されるライブラリ群。 * Hadoop Distributed File System (HDFS): Hadoop独自の分散ファイルシステム。 * Hadoop YARN: Hadoopクラスタのリソース管理や、Hadoop上で動作するアプリケーションのスケジューリングを担当する。 * Hadoop MapReduce: Hadoop上で動作するMapReduceフレームワークの実装。 また、HadoopではHDFS以外のファイルシステムもサポートしている。2015年5月現在では、下記のファイルシステムをサポートしている。 * HDFS * Amazon S3 * OpenStack Swift * Microsoft Azure * FTP、HTTP、およびHTTPS経由でアクセス可能なファイルシステム 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Apache Hadoop」の詳細全文を読む スポンサード リンク
|